import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
%matplotlib inline


car = pd.read_csv('data/car-sales.csv')

car


car.values

array([['Toyota', 'White', 150043, 4, '$4,000.00'],
       ['Honda', 'Red', 87899, 4, '$5,000.00'],
       ['Toyota', 'Blue', 32549, 3, '$7,000.00'],
       ['BMW', 'Black', 11179, 5, '$22,000.00'],
       ['Nissan', 'White', 213095, 4, '$3,500.00'],
       ['Toyota', 'Green', 99213, 4, '$4,500.00'],
       ['Honda', 'Blue', 45698, 4, '$7,500.00'],
       ['Honda', 'Blue', 54738, 4, '$7,000.00'],
       ['Toyota', 'White', 60000, 4, '$6,250.00'],
       ['Nissan', 'White', 31600, 4, '$9,700.00']], dtype=object)


print(car['Price'].to_list())

['$4,000.00', '$5,000.00', '$7,000.00', '$22,000.00', '$3,500.00', '$4,500.00', '$7,500.00', '$7,000.00', '$6,250.00', '$9,700.00']


pd.DataFrame({'a':[1,2],'b':[2,3]})


car.columns

Index(['Make', 'Colour', 'Odometer (KM)', 'Doors', 'Price'], dtype='object')


make=['Toyota', 'Honda', 'Toyota', 'BMW', 'Nissan', 'Toyota', 'Honda', 'Honda', 'Toyota', 'Nissan'] # 汽车生产商
color = ['White', 'Red', 'Blue', 'Black', 'White', 'Green', 'Blue', 'Blue', 'White', 'White'] # 汽车颜色
odometer = [150043, 87899, 32549, 11179, 213095, 99213, 45698, 54738, 60000, 31600] # 里程
doors = [4, 4, 3, 5, 4, 4, 4, 4, 4, 4] # 车门数量
price = ['$4,000.00', '$5,000.00', '$7,000.00', '$22,000.00', '$3,500.00', '$4,500.00', '$7,500.00', '$7,000.00', '$6,250.00', '$9,700.00']
car = pd.DataFrame({'Make':make, 'Colour':color, 'Odometer (KM)':odometer, 'Doors':doors, 'Price':price})


print(car.to_markdown())

|    | Make   | Colour   |   Odometer (KM) |   Doors | Price      |
|---:|:-------|:---------|----------------:|--------:|:-----------|
|  0 | Toyota | White    |          150043 |       4 | $4,000.00  |
|  1 | Honda  | Red      |           87899 |       4 | $5,000.00  |
|  2 | Toyota | Blue     |           32549 |       3 | $7,000.00  |
|  3 | BMW    | Black    |           11179 |       5 | $22,000.00 |
|  4 | Nissan | White    |          213095 |       4 | $3,500.00  |
|  5 | Toyota | Green    |           99213 |       4 | $4,500.00  |
|  6 | Honda  | Blue     |           45698 |       4 | $7,500.00  |
|  7 | Honda  | Blue     |           54738 |       4 | $7,000.00  |
|  8 | Toyota | White    |           60000 |       4 | $6,250.00  |
|  9 | Nissan | White    |           31600 |       4 | $9,700.00  |

car


car.describe(include=['object', 'float', 'int'])


car.describe()


def to_num(x):
    x_new = x.replace('$','') # 去掉$符号
    x_new = x_new.replace(',','') # 去掉逗号,
    return float(x_new) # 返回浮点数


car['Price'].apply(to_num)

0     4000.0
1     5000.0
2     7000.0
3    22000.0
4     3500.0
5     4500.0
6     7500.0
7     7000.0
8     6250.0
9     9700.0
Name: Price, dtype: float64


test.replace('$','')

'2,700.000'


test.replace(',','')

'$2700.000'

	Make	Colour	Odometer (KM)	Doors	Price
count	10	10	10.000000	10.000000	10
unique	4	5	NaN	NaN	9
top	Toyota	White	NaN	NaN	$7,000.00
freq	4	4	NaN	NaN	2
mean	NaN	NaN	78601.400000	4.000000	NaN
std	NaN	NaN	61983.471735	0.471405	NaN
min	NaN	NaN	11179.000000	3.000000	NaN
25%	NaN	NaN	35836.250000	4.000000	NaN
50%	NaN	NaN	57369.000000	4.000000	NaN
75%	NaN	NaN	96384.500000	4.000000	NaN
max	NaN	NaN	213095.000000	5.000000	NaN

	Odometer (KM)	Doors
count	10.000000	10.000000
mean	78601.400000	4.000000
std	61983.471735	0.471405
min	11179.000000	3.000000
25%	35836.250000	4.000000
50%	57369.000000	4.000000
75%	96384.500000	4.000000
max	213095.000000	5.000000

Pandas的安装与导入¶

数据导入¶

生成`DataFrame`¶

数据描述¶

数据索引¶

提取单列或多列数据¶

`loc`与`iloc`的使用方法¶

`apply`的用法¶

	Make	Colour	Odometer (KM)	Doors	Price
0	Toyota	White	150043	4	$4,000.00
1	Honda	Red	87899	4	$5,000.00
2	Toyota	Blue	32549	3	$7,000.00
3	BMW	Black	11179	5	$22,000.00
4	Nissan	White	213095	4	$3,500.00
5	Toyota	Green	99213	4	$4,500.00
6	Honda	Blue	45698	4	$7,500.00
7	Honda	Blue	54738	4	$7,000.00
8	Toyota	White	60000	4	$6,250.00
9	Nissan	White	31600	4	$9,700.00

Pandas的安装与导入¶

数据导入¶

生成DataFrame¶

数据描述¶

数据索引¶

提取单列或多列数据¶

loc与iloc的使用方法¶

apply的用法¶

生成`DataFrame`¶

`loc`与`iloc`的使用方法¶

`apply`的用法¶